# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html


# useful for handling different item types with a single interface
from itemadapter import ItemAdapter

# 如果想使用管理的话 那么就必须在settings中开启管道
class ScrapyDangdang39Pipeline:
    # 在爬虫文件开始之前就执行的一个方法
    def open_spider(self, spider):
        self.fp = open('book.json', 'w', encoding='utf-8')

    # item就是yield后面的book对象
    def process_item(self, item, spider):
        # 以下这种模式不推荐 因为每传递过来一个对象 那么就打开一次文件 对文件的操作过于频繁
        #

        # write方法必须要写一个字符串 而不能是其他的对象
        # w模式 会每一个对象都打开一次文件 覆盖之前的内容
        # with open('book.json', 'a', encoding='utf-8') as f:
        #     f.write(str(item))
        self.fp.write(str(item))

        return item


    # 在爬虫文件执行完毕之后 执行的方法
    def close_spider(self, spider):
        self.fp.close()

import urllib.request

# 多条管道开启
# 定义管道类
# settings中开启管道
class DangdangDownloadPipeline:
    def process_item(self, item, spider):
        url = "http:"+item.get('src')
        filename = "./books/" + item.get('name') + ".jpg"

        urllib.request.urlretrieve(url=url, filename=filename)

        return item